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В работе предлагается методика на основе ансамблей моделей ДЛЯ идентификации объектов дистан- 
ционного зондирования Земли. В качестве модели предлагается использовать многослойную сверточную 
нейронную сеть. Определение оптимальных гиперпараметров модели предлагается выполнять методами се- 
ТОЧНОГО ИЛИ случайного поиска с использованием К-кратной перекрёстной проверки. Показан способ повы- 
шения точности идентификации объектов с использованием ансамбля нейронных сетей. Представлены ре- 
зультаты проведения эксперимента с использованием данных дистанционного зондирования Земли. Реша- 
лась задача идентификации объектов двух классов, в качестве тестовых данных использовались изображе- 
ния, полученные с помощью радара с синтезированной апертурой. 
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Введение 

Дистанционное зондирование Земли 
(ДЗЗ) - наблюдение поверхности Земли 
наземными, авиационными и космически- 
ми средствами, оснащёнными различны- 
ми видами съемочной аппаратуры. Рабо- 
чий диапазон длин волн, принимаемых 
съёмочной аппаратурой, составляет от до- 
лей микрометра (видимое оптическое из- 
лучение) до метров (радиоволны). Методы 
зондирования могут быть пассивные, то 
есть использующие естественное отра- 
женное или вторичное тепловое излуче- 
ние объектов на поверхности Земли, об- 
условленное солнечной активностью, и 
активные, использующие вынужденное 
излучение объектов, инициированное ис- 
кусственным источником направленного 
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действия. Данные ДЗЗ, полученные с кос- 
мического аппарата (КА), характеризуют- 
ся большой степенью зависимости от про- 
зрачности атмосферы. Поэтому на КА ис- 
пользуется многоканальное оборудова- 
ние пассивного и активного типов, регист- 
рирующее электромагнитное излучение в 
различных диапазонах. 

Постановка проблемы 

При ДЗЗ применяется обработка 
цифровых данных, представленных в ви- 
де двухмерного изображения, которое в 
одном спектральном диапазоне можно 
представить в виде матрицы (двухмерно- 
го массива) чисел [(, ]), каждое из кото- 
рых представляет интенсивность излуче- 
ния, принятого датчиком от элемента по- 
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верхности Земли, которому соответствует 
один пиксель изображения. 

Изображение состоит из п Х т пик- 
селей, каждый пиксель имеет координаты 
(1, /) — номер строки и номер колонки. Ес- 
ли изображение получено в нескольких 
диапазонах электромагнитного спектра, 
то его представляет трехмерная решетка, 
состоящая из чисел /[ (1, }, К), где К - но- 
мер спектрального канала. Таким обра- 
зом, информация, получаемая при ДЗЗ, 
представляет собой данные с пространст- 
венными связями между признаками / (1, 
Л). Для подобного рода данных в послед- 
ние годы наиболее успешно применялись 
глубокие сверточные нейронные сети [5]. 

Сверточные нейронные сети 

Архитектура сверточных нейрон- 
ных сетей (СНС) была предложена Яном 
Лекуном и нацелена на эффективное рас- 
познавание изображений. Свое название 
архитектура сети получила из-за наличия 
операции свертки, суть которой заключа- 
ется в том, что каждый фрагмент изобра- 
жения умножается на матрицу (ядро) 
свертки поэлементно, а результат сумми- 
руется и записывается в аналогичную по- 
зицию изображения [7]. 

СНС обычно представляет собой 
чередование сверточных слоев, субдиск- 
ретизирующих слоев и полносвязных 
слоев. Все три вида слоев могут чередо- 
ваться в произвольном порядке. 

Полносвязный слой (4епзе) - слой, в 
котором каждый нейрон соединен со все- 
ми нейронами на предыдущем уровне, 
причем каждая связь имеет свой весовой 
коэффициент. В отличие от полносвязно- 
го, в сверточном (сопуошйоп) слое ней- 
рон соединен лишь с ограниченным ко- 
личеством нейронов предыдущего уров- 
ня, то есть сверточный слой аналогичен 
применению операции свертки, где ис- 
пользуется лишь матрица весов неболь- 
шого размера (ядро свертки). 

Субдискретизирующий слой выпол- 
няет уменьшение размерности (роойпз). 
Это можно делать различными способа- 
ми, но зачастую используется метод вы- 
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бора максимального элемента - слой при- 

знаков разделяется на ячейки, из кото- 

рых выбирается максимальное значение и 

передается в следующий слой. 

Огорой! слой представляет собой ме- 
тод регуляризации в нейронных сетях, 
обучение в которых обычно производят 
стохастическим градиентным спуском. 
Огороц{ регуляция заключается в измене- 
нии структуры сети: каждый нейрон от- 
ключается с некоторой вероятностью р на 
1-ом этапе обучения. По такой прорежен- 
ной сети производится обучение, а для ос- 
тавшихся весов делается градиентный шаг. 

Ансамбль нейронных сетей 

Точность идентификации объектов 
может быть повышена с использованием 
АНС [1-3], то есть набора НС, принимаю- 
щего решения путем усреднения результа- 
тов работы отдельных НС. Для этого необ- 
ходимо реализовать вариативность НС в 
ансамбле. Для чего могут использоваться 
следующие подходы или их сочетания: 

- использование различных частей обу- 
чающей выборки; 

- случайная инициализация весов НС; 

- вариации архитектур НС в ансамбле 
(добавление скрытых слоев, добавле- 
ние/удаление нейронов скрытого слоя). 

Выходное значение АНС формиру- 
ется как взвешенная сумма выходов от- 
дельных НС. Данный подход проиллюст- 
рирован на рисунке 1. 

Случай с одним выходным нейро- 
ном вычисляется по формуле: 


п 
уе (р 
= , 

где п - число моделей; у; - выход 1-Й 
НС; их - вес -й НС, который фор- 
мируется по формуле: 


А: 
= ©) 
>. А) 
= 
где А; - выбранная мера ошибки, 


рассчитанная для 1-й НС; 
п - число моделей. 
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Входной вектор 


И/л. -.: Из И/2 И/1 М/о 


у 
Рис. 1. Взвешенный АНС 


Методика на основе ансамблей 
моделей для идентификации объектов 
дистанционного зондирования Земли 

Предлагаемая методика состоит из 
следующих шагов: 

Шаг 1.Постановка задачи: определение 
типа исходных данных, определение 
идентифицируемых объектов, определе- 
ние меры оценки качества моделей. 

Шаг 2. Формирование обучающего набо- 
ра на исходных данных: сбор данных, 
предобработка, разметка выходного 
набора. 

Шаг 3.Поиск дополнительных признаков 
для решения поставленной задачи. 

Шаг 4.Расширение обучающего набора 
дополнительными признаками. 

Шаг 5.Разделение обучающего набора на 
тренировочный и тестовый. 

Шаг 6. Определение архитектуры модели 
на основе исходных данных. 

Шаг 7.Определение диапазонов гиперпа- 
раметров выбранной архитектуры. 

Шаг 8.Определение оптимальных гипер- 
параметров модели методами сеточого 
или случайного поиска [6] с использова- 
нием К-кратной перекрёстной проверки 
на тренировочном наборе. 

Шаг 9.Если модель удовлетворяет мере 
оценки качества на тестовом наборе, то 
задача решена, иначе необходимо расши- 
рить набор данных и перейти на шаг 4. 
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Проведение эксперимента 

Набор экспериментальных данных 
представляет собой изображения, полу- 
ченные с помощью радара с синтезиро- 
ванной апертурой (РСА), который позво- 
ляет получать радиолокационные изобра- 
жения земной поверхности и находящихся 
на ней объектов независимо от метеороло- 
гических условий и уровня естественной 
освещенности местности с детальностью, 
сравнимой с аэрофотоснимками. 

Данные [4]: 

— снимки в двух поляризационных режимах: 
горизонтальный/горизонтальный, 
горизонтальный/вертикальный; 

— каждый снимок содержит один объект: 
корабль или айсберг (см. рисунок Рис. 2); 

— угол падения; 

— тренировочный набор: 1604 снимков, 
75%75: 

— тестовый набор: 8424 снимка, 75х75. 

Необходимо решить задачу бинар- 
ной классификации айсберг/корабль. 


6) 


Рис. 2. Пример изображений: а) корабль, 
6) айсберг 


Меры оценки моделей 

Эффективность в задаче классифи- 
кации может оцениваться с использова- 
нием матрицы неточностей (сопЁаз1оп 
таблх). С ее помощью можно рассчитать 
такие метрики, как точность (Ргес1я1юоп), 
полнота (КесаП) и Е-мера. Базовой мерой 
выступает ассигасу - доля правильных 
ответов модели. 
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Матрица неточностей - это матрица 
размера М на М, где М - это количество 
классов. Столбцы этой матрицы резерви- 
руются за фактическими значениями ин- 
дексов классов, а строки — за решениями 
классификатора. Когда классифицирует- 
ся объект из тестовой выборки, то увели- 
чивается значение, стоящее на пересече- 
нии строки класса, который вернул клас- 
сификатор, и столбца класса, к которому 
действительно относится объект. Точ- 
ность равна отношению соответствующе- 
го диагонального элемента матрицы и 
суммы всей строки класса. Полнота — от- 
ношению диагонального элемента матри- 
цы и суммы всего столбца класса. 

Е-мера представляет собой гармо- 
ническое среднее между точностью и 
полнотой. 

Для задачи бинарной классифика- 
ции, при выводе моделью вероятности 
класса, может быть использована лога- 
рифмическая функция потерь: 

1 


1091055 = — ЭХ 105(5,) + (1 — у:)ю= А — 5,)) (3) 
= 


где У, - это ответ алгоритма на 1-ом 
объекте, У - истинная метка класса на |- 
ом объекте, [- размер выборки. 

Минимизацию [081055 можно пред- 
ставить как задачу максимизации ассигасу 
путем штрафа за неверные предсказания. 
Однако необходимо отметить, что [08[055 
крайне сильно штрафует за уверенность 
классификатора в неверном ответе. Следо- 
вательно, ошибка на одном объекте может 
дать существенное ухудшение общей 
ошибки на выборке. Такие объекты часто 
бывают выбросами, которые нужно не за- 


Таблица 1. Результат оценки моделей 
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бывать фильтровать или рассматривать 
отдельно. 

Результаты 

Исходя из параметров исходных 
данных, была предложена базовая СНС: 

Сверточный слой, 64 ядра 3х3; 

РооПип® 2х2; 

Огороце с вероятностью 0.3; 

Сверточный слой, 128 ядер 3х3; 

РооПипз 2х2; 

Огороце с вероятностью 0.3; 

Сверточный слой, 128 ядер 3х3; 

РооПип® 2х2; 

ОгороцЕ с вероятностью 0.3; 

Сверточный слой, 64 ядер 3х3; 

РооПип® 2х2; 

Огороце с вероятностью 0.3; 

Полносвязный слой 1024 нейрона; 

ОгороцЕ с вероятностью 0.1; 

Полносвязный слой 512 нейрона; 

ОгороцЕ с вероятностью 0.1; 

Выходной слой 5ойтах. 

СНС принимает на вход псевдоизо- 
бражение, в котором первый канал изо- 
бражения представлен ГГ каналом исход- 
ных данных, второй канал изображения 
представлен ГВ каналом, третий канал 
изображения представлен их композитом. 
Обучение СНС выполнялось по стохасти- 
ческому градиентному алгоритму Адат 
[8]. Перекрестная проверка выполнялась 
для К = 5. На основе базовой СНС форми- 
ровался АНС из пяти моделей. 

Результат оценки данных моделей 
представлен в таблице 1. Из таблицы вид- 
но, что Ансамбль СНС моделей показы- 
вает наименьшую [081055 ошибку на тес- 
товом наборе данных. 


Модель Асситасу, [081[05$, Асситасу, 081055, 
тренировочный набор | тренировочный набор | тестовый набор | тестовый набор 
СНС 0.922 0.203 0.917 0.223 
Ансамбль 0.936 0.155 0.932 0.166 
Заключение подготовку данных, определение призна- 


Предложена методика для иденти- 
фикации объектов дистанционного зон- 
дирования Земли. Методика включает: 
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ков объектов, формирование архитекту- 
ры модели идентификации и поиск ги- 
перпараметров модели. Предложены мо- 
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дели для анализа изображений ДЗЗ на ос- 
нове ансамбля СНС. 

Методика была применена при про- 
ведении эксперимента с использованием 
данных ДЗЗ. Оценка предложенных мо- 
делей показала, что одним из эффектив- 
ных способов увеличения точности в за- 
дачах машинного обучения является фор- 
мирование ансамбля моделей. 
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У. Маги$ВКо, А. Род т 

От? ап епзетЫе оЁ сопуомопа! 
пеига! пебуогК$ 10 ргосе$$ гетое зеп$те 
даа 

А шефо@ Гог 14епйРуштя обес оЁ 
тетое зепзш» оЁ фе Еаг@ 15 ргорозеа, Фе 
тео шс1а4ез: деегиттте Фе (уре оЁ 
зоигсе даа, аеегилшите 14епаНаЫе обес, 
аеглшшя а теазиге ог аззеззше Фе 
апаШеу оЁ то4е!з, Гогише а Наше $е оп 
Фе зоигсе даа, ащегииии» Теабге$ оЁ 
обес, Ююпише ап 14епийсабоп тоде 
агсбИесвате, Ааегииите гапоез оЁ Вурег- 
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рагатеег$ оЁ Фе з@есе4 агсЬцес@хге Бурег- 
рагаплеег$ оЁ Фе тоде]. [ 1$ ргорозе ю 
реФогт Фе ааегиитайноп оЁ Ше орйта! 
Буреграгатеег$ оЁ ше то4е] изт? Фе спа 
ог гап4от зеагсВ пефо4$ изт?» Фе К-РЮю1а 
сгоз$-сНеск оп Фе ташиис $61. 

Моде! Гог Фе апа[у$1$ оЁ итазез$ оЁ 
гето{е зепзше оЁ фе Еай оп Фе Ба51$ оРап 
епзетЫе оЁ сопуоаНопа| пеига! пе\уогК$ 
аге ргорозед. Тбе агсЬцесите оЁ сопуош- 
Попа! пеига| пебуогК$ 1$ ап аЦегпаноп оЁ 
сопуойопа!| Тауегз, зибзатр!е4 1ауегз, апа 
Шу соппесе4 Тауегз. 

ТБе ассигасу оЁ1АепиРуте обес сап 
Бе ппргоуе4 изше ап епзетЫе оЁ пеига! 
пегмогК$, фаЕ 1$, а зеё оЁ пло4е]$ Фа таКез 
Чес151оп$ Бу асотегайпе фе гезиМ$ оЁ Ше 
у\огк о шатуна! пебуогк$. ш 1$ рарег, 
Фе ошриё уаше оЁ ап епзетЫе оЁ пеига| 
пебмогК$ 1$ Гогте4 аз а \е1еЩеа зит оЁ Фе 
оирив оРштагу1ана! тоде[5. 

'ТБе {есбиие \уаз аррЦед диптих фе 
ехреттепе изше даёа Мот тетое зеп$те 
ог фе Еамь. Тре аа 5е1 15 ап птасе 
оаше4 изте зупейс арегге гадаг. 

ТВе Баз1с сопуошйопа! пеига] пебуогк 
сошаш$ Ююиг сопуоавопа!| Тауег$ ап @гее 
[-5гапдед. ТЬе очёри( ПТауег 1$ зойтах. 
Тре пебуогК тесеуез аз шрш а рзеидо- 
ппазе ш у/БсЬ Фе Вгз( сВаппе] оЁ Фе ппазе 
15 гергезещеа Бу Ше Вопхота / Вопхопа1 
сваппе] о? ро|аптайоп оЁ Фе зоигсе даа, Ше 
зесопа сваппе] 15 гергезещед Бу Ше птазе$ 
Бу Ше Боптоп(а-уегаса! сБаппе] оЁ ро]апта- 
поп, Ше Шиа сВаппе! оЁ Ше птазе 15 
тергеземеа Бу Фет сотрозце аз попта|йтеа 
зит оЁ сВаппе|$. 

МебуогК паште \а$ рейогте4 и$11$ 
Фе Адат зосВазис отафепе аогит. 
Вазе4 оп Фе Баз1с сопуошНопа| пебмо!К, ап 
епзетЫе оЁ Нуе то4е$ \уаз деуе]оре4 фа 
уеге шашей оп ЧШегепе раз оЁ фе па! 
ага ш Фе ргосез$ оЁ сгоз$-уаНдайоп. 

Еуааабоп оЁ Фе ргорозе4 тоде|5 
зВо\е ФаЁ опе оЁ фе еНеснуе \ауз © 
шсгеазе ассигасу ш тасЬше 1еагите (азК$ 
1$ © Юг ап епзетЫе оЁ тоде1. 
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